检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于生成对抗网络的基因数据生成方法

曹一珉, 蔡磊, 高敬阳

《计算机应用》唯一官方网站 2022, 42 (3): 783-790. DOI: 10.11772/j.issn.1001-9081.2021040759

摘要（319）

HTML （14）

PDF （1786KB）（128）

在深度学习中，随着卷积神经网络（CNN）的深度不断增加，进行神经网络训练所需的数据会越来越多，但基因结构变异在大规模基因数据中属于小样本事件，导致变异基因的图像数据十分匮乏，严重影响了CNN的训练效果，造成了基因结构变异检测精度差、假阳性率高等问题。为增加基因结构变异样本数量，提高CNN识别基因结构变异的精度，提出了一种基于生成对抗网络（GAN）进行基因图像数据扩增的方法——GeneGAN。首先，利用Reads堆叠方法生成初始基因图像数据，将变异基因图像数据与非变异基因图像数据分为两个数据集；然后，为了平衡正负样本数据集，使用GeneGAN对变异图像样本进行扩充；最后，通过CNN对平衡前后数据集进行检测，并对精确率、召回率与F1值进行对比。实验结果显示，与传统扩增方法、生成对抗网络扩增方法、特征提取方法相比，GeneGAN对基因结构变异检测的F1值提升了1.94~17.46个百分点，说明使用GeneGAN进行基因数据生成能够有效提高使用CNN进行基因图像分类的精确率。

图表 | 参考文献 | 相关文章 | 多维度评价